انبار داده ( Data Warehouse ) چیست؟
انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد.
تكنولوژي انبار دادهها شامل مجموعهای مفاهيم و ابزارهای جديدی است كه با فراهم آوردن اطلاعات از دانشگران (افراد اجرايي، مدير و تحليلگر) در تصميم گيری پشتيباني مينمايد. دليل اصلي ساخت انبار داده ها، بهبود كيفيت اطلاعات در سازمان است، در واقع دسترسي به دادهها از هر جا درون سازمان دادهها از منابع داخلي و خارجي تهيه ميشوند و به اشكال گوناگون از دادههای ساختاری گرفته تا دادههای ساخت نيافته مانند فايلهاي متني يا چند رسانهای، در مخزني مجتمع ميشوند. انبار دادهها يا DWH مخزني از اين دادههاست كه به صورتي قابل درك در دسترس كاربران نهايي كسب و كار قرار ميگيرد.
انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد. انبارهای داده حاوی داده هایی هستند که به مرور زمان از سیستم های عملیاتی آنلاین سازمان ( OLTP ) استخراج می شوند، بنابراین سوابق کلیه اطلاعات و یا بخش عظیمی از آنها را می توان در انبار داده ها مشاهده نمود.
از آنجائیکه انجام عملیات آماری و گزارشات پیچیده دارای بارکاری بسیار سنگینی برای سرورهای پایگاه داده می باشند، وجود انبار داده سبب می گردد که اینگونه عملیات تاثیری بر فعالیت برنامه های کاربردی سازمان ( OLTP ) نداشته باشد.
همانگونه که پایگاه داده سیستمهای عملیاتی سازمان ( برنامه های کاربردی ) به گونه ای طراحی می شوند که انجام تغییر و حذف و اضافه داده به سرعت صورت پذیرد، در مقابل انبار داده ها دارای معماری ویژه ای می باشند که موجب تسریع انجام عملیات آماری و گزارش گیری می شود ( OLAP ) .
مراحل و نحوه ایجاد انبار داده در سازمان
1- استخراج داده های تراکنشی از پایگاه های داده به یک مخزن واحد شناخت منابع داده های سازمان و استخراج داده های ارزشمند از آنها یکی از اصلی ترین مراحل ایجاد انبار داده می باشد. 2- تبدیل داده ها از آنجائیکه سیستمهای اطلاعاتی و برنامه های کاربردی یک سازمان غالبا توسط افراد و پروژه های مختلف به مـرور زمان در مواجهـه با نیـازهای جدید سـاخته یا تغییر شـکل داده می شـوند، یکسـان سـازی آنها امری ضروری می باشد.در بسیاری از موارد نیز سیستمهای اطلاعاتی در بستر های مختلف پایگاه داده مانند Microsoft SQL Server ، Oracle ، Sybase ، Microsoft Access و غیره طراحی گردیده اند. بررسی جداول، برقراری ارتباط بین فیلدها و یک شکل سازی داده ها در این مرحله صورت می پذیرد.
3- بارگذاری داده های تبدیل شده به یک پایگاه داده چند بعدی بر خلاف پایگاه داده سیستمهای عملیاتی ( OLTP ) که دارای معماری رابطه ای می باشند و از اصول نرمالیزه استفاده می کنند، طراحی انبار داده به شکلی ویژه بدون بهره گیری از اصول نرمالیزاسیون می باشد. درانبار داده فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات هنگام گزارشات و عملیات آماری می باشد.
4- تولید مقادیر از پیش محاسبه شده جهت افزایش سرعت گزارش گیری مـقادیر از پیـش محاسـبه شده را تراکـم نیـز مـی نامـند. ایـن مرحلــه توســط سیستـمهایی نظــیر Microsoft SQL Server Analysis Services بسیار ساده تر شده است. ایـن تراکم ها کـه در ابـعاد مختلـف انبار داده سـاخته می شوند، موجب می شوند که سرعت انجام عملیات گزارش گیری به شکل محسوسی افزایش یابد. بایدتوجه داشت که عملیات ساخت این مقادیر بسیار زمان گیر بوده و نیازمند حافظه زیادی بر روی سروراست. 5- ساخت ( یا خرید ) یک ابزار گزارش گیری پس از انجام مراحل فوق، شـما می توانـید نسبـت به ساخت یا خـرید یـک نرم افزار گزارش گیـری تصمیم گیری نمایید. به طور معمـول هزینه سـاخت یک نرم افزار گزارش گـیری، بالاتـر از هزینـه خریـد آن از یک شرکت خارجـیمی شود.
ويژگيهاي اصلي دادههای انبار دادهها
دادههای موجود در انبار دادهها از سيستمهای عملياتي متنوع (نظير سيستمهاي پايگاه دادهها) و منابع دادهای خارجي (نظير پايگاه دادههای آماری و WWW )يكپارچه ميشوند. تفاوتهای ساختاری ومعنايي دادهها بايد پيش از يكپارچه سازی انسجام يابند. براي مثال دادهها بايد مطابق با مدل دادهای يكپارچه "همگن" شوند. بعلاوه، مقادير دادهاي سيستمهاي عملياتي بايد پاك شوند تا دادههای صحيحي در انبار دادهها وارد شوند.
نياز به دادههای تاريخي يكي از موارد مهم درشيوه انبار دادههاست. دادههای تاريخي برای تحليل روند كسب وكارضروری هستند. البته هزينه نگهداری اين گونه دادهها نيز بايد مورد توجه قرار گيرد. بعلاوه، دادههای انبار دادهها ثابت هستند، براي مثال دسترسي به DWH از نوع خواندني است. انجام اصلاحات در اين دادهها فقط هنگامي صورت ميگيرد كه اصلاحات دادههای منبع در انبار انتشار يابند. DWH دادههای ديگری به نام دادههای اشتقاق يافته ( derived data ) دارد. اين دادهها به طور صريح در منابع عملياتي ذخيره نميشوند، بلكه در حين بعضي از فرايندها از دادههای عملياتي، اشتقاق مييابند. برای مثال دادههای فروش را ميتوان در سطوح مختلف (هفتگي، ماهانه، فصلي) در انبار ذخيره نمود.
|
25 نظر
محمد زند / 10 شب / 5 دی 1395, / جواب
ارسال آرشیو محتوا
محمد زند / 10 شب / 5 دی 1395, / جواب
محتوای ارسالی از آرشیو 1393